Telegram Group & Telegram Channel
πŸ”₯ Π—Π°Π΄Π°Ρ‡Π°: "ДинамичСская пСрСобучаСмая модСль с ограничСниями Π΄Π°Π½Π½Ρ‹Ρ…"

β–ͺ️ УсловиС Π·Π°Π΄Π°Ρ‡ΠΈ:


Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ систСму машинного обучСния для ΠΎΠ½Π»Π°ΠΉΠ½-Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ, которая Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π”Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹ΠΌ ΠΏΠΎΡ‚ΠΎΠΊΠΎΠΌ Π² Π²ΠΈΠ΄Π΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… дСйствий.

Π”Π°Π½ΠΎ:

- ΠŸΠΎΡ‚ΠΎΠΊ событий Π²ΠΈΠ΄Π°:

{
"user_id": "string",
"event_type": "click" | "view" | "purchase",
"item_id": "string",
"timestamp": "ISO 8601",
"features": {
"device_type": "mobile" | "desktop",
"location": "string",
"time_of_day": "morning" | "afternoon" | "evening" | "night",
"category": "string"
}
}


ВрСбования:

1. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль, которая:
- ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΊΡƒΠΏΠΊΠΈ (`purchase`) ΠΏΠΎ ΡΠΎΠ±Ρ‹Ρ‚ΠΈΡŽ view.
- МодСль Π΄ΠΎΠ»ΠΆΠ½Π° динамичСски ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒΡΡ ΠΏΡ€ΠΈ поступлСнии Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ пСрСобучСния с нуля.
- ΠŸΡ€ΠΈ этом историчСскиС Π΄Π°Π½Π½Ρ‹Π΅ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· 24 часа (Π΄Π°Π½Π½Ρ‹Π΅ "ΠΆΠΈΠ²ΡƒΡ‚" Ρ‚ΠΎΠ»ΡŒΠΊΠΎ сутки).

2. Π’Π½Π΅Π΄Ρ€ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ:
- ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΡ Π΄Ρ€Π΅ΠΉΡ„Π° Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· доступа ΠΊ старым Π΄Π°Π½Π½Ρ‹ΠΌ.
- АвтоматичСского пСрСзапуска пСрСобучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠΈ сущСствСнного Π΄Ρ€Π΅ΠΉΡ„Π°.

3. ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ:
- Π’Ρ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° событий Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти.
- Latency прСдсказания ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” Π½Π΅ Π±ΠΎΠ»Π΅Π΅ 100 миллисСкунд.

---

β–ͺ️ ## Подсказки:

- ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΏΡ€ΠΎ использованиС on-line learning ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier с partial_fit Π² sklearn, ΠΈΠ»ΠΈ свои Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π° Π±Π΅Π· хранСния ΠΏΠΎΠ»Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ:
- Бтатистики ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ (ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΎΠΊΠ½Π°, гистограммы, PSI / KL-Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ).
- ΠœΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ распрСдСлСний Ρ‡Π΅Ρ€Π΅Π· ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ.
- Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΏΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΎΠ± очСрСдях сообщСний ΠΈ микросСрвисной Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅.
- Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, стоит Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ feature hashing для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

---

β–ͺ️ ## Π§Ρ‚ΠΎ оцСниваСтся:

- Π£ΠΌΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ΄ ограничСния Π·Π°Π΄Π°Ρ‡ΠΈ.
- Навыки построСния систСм с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎ памяти ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΎΡ‚Π²Π΅Ρ‚Π°.
- Π‘ΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Ρ€Π΅ΠΉΡ„ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π½Π° Π½Π΅Π³ΠΎ Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.
- Чистота ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.
- ПониманиС особСнностСй ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ½-ML систСм.

---

β–ͺ️ ## Π Π°Π·Π±ΠΎΡ€ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:

**АрхитСктура Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:**

- Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ½Π»Π°ΠΉΠ½-модСль (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier, Vowpal Wabbit, ΠΈΠ»ΠΈ свою Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ логистичСской рСгрСссии).
- Для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ feature hashing (Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ роста количСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²).
- ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Ρ‚ΡŒ "ΠΆΠΈΠ²ΠΎΠΉ" Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π±ΡƒΡ„Π΅Ρ€ Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти:
- Π₯Ρ€Π°Π½ΠΈΡ‚ΡŒ послСдниС N событий (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½) с рСгулярным ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠ΅ΠΌ ΡƒΡΡ‚Π°Ρ€Π΅Π²ΡˆΠΈΡ… записСй (TTL).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π°:
- Π‘Π»Π΅Π΄ΠΈΡ‚ΡŒ Π·Π° срСдними значСниями ΠΈΠ»ΠΈ частотами ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.
- ΠŸΡ€ΠΈ Ρ€Π΅Π·ΠΊΠΈΡ… измСнСниях β€” Ρ‚Ρ€ΠΈΠ³Π³Π΅Ρ€ΠΈΡ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с нуля.

ΠŸΡ€ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ слоТности:

- ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° "Ρ…ΠΎΠ»ΠΎΠ΄Π½ΠΎΠ³ΠΎ старта" ΠΏΡ€ΠΈ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π΅Π· большого объСма Π΄Π°Π½Π½Ρ‹Ρ….
- Как ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ пСрСобучСния Π½Π° ΡˆΡƒΠΌ ΠΏΡ€ΠΈ частом ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
- Баланс ΠΌΠ΅ΠΆΠ΄Ρƒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ качСством ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΡ‡Π΅Π½ΡŒ частом ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ:

- Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ гистограммы для ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (`histogram_sketching`).
- Feature hashing (`HashingVectorizer`, `FeatureHasher`).
- ΠœΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния (`partial_fit`, warm_start ΠΌΠΎΠ΄Π΅Π»ΠΈ).
- ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ для ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π° Π΄Ρ€Π΅ΠΉΡ„Π°: Population Stability Index (PSI), JS/ KL дивСргСнция.

Π”Π΅Π»ΠΈΡ‚Π΅ΡΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π² коммСнтариях πŸ‘‡

@machinelearning_interview

#собСсСдованиС #Π·Π°Π΄Π°Ρ‡Π° #ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠ΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
Please open Telegram to view this post
VIEW IN TELEGRAM



tg-me.com/machinelearning_interview/1772
Create:
Last Update:

πŸ”₯ Π—Π°Π΄Π°Ρ‡Π°: "ДинамичСская пСрСобучаСмая модСль с ограничСниями Π΄Π°Π½Π½Ρ‹Ρ…"

β–ͺ️ УсловиС Π·Π°Π΄Π°Ρ‡ΠΈ:


Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ систСму машинного обучСния для ΠΎΠ½Π»Π°ΠΉΠ½-Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ, которая Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π”Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹ΠΌ ΠΏΠΎΡ‚ΠΎΠΊΠΎΠΌ Π² Π²ΠΈΠ΄Π΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… дСйствий.

Π”Π°Π½ΠΎ:

- ΠŸΠΎΡ‚ΠΎΠΊ событий Π²ΠΈΠ΄Π°:


{
"user_id": "string",
"event_type": "click" | "view" | "purchase",
"item_id": "string",
"timestamp": "ISO 8601",
"features": {
"device_type": "mobile" | "desktop",
"location": "string",
"time_of_day": "morning" | "afternoon" | "evening" | "night",
"category": "string"
}
}


ВрСбования:

1. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль, которая:
- ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΊΡƒΠΏΠΊΠΈ (`purchase`) ΠΏΠΎ ΡΠΎΠ±Ρ‹Ρ‚ΠΈΡŽ view.
- МодСль Π΄ΠΎΠ»ΠΆΠ½Π° динамичСски ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒΡΡ ΠΏΡ€ΠΈ поступлСнии Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ пСрСобучСния с нуля.
- ΠŸΡ€ΠΈ этом историчСскиС Π΄Π°Π½Π½Ρ‹Π΅ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· 24 часа (Π΄Π°Π½Π½Ρ‹Π΅ "ΠΆΠΈΠ²ΡƒΡ‚" Ρ‚ΠΎΠ»ΡŒΠΊΠΎ сутки).

2. Π’Π½Π΅Π΄Ρ€ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ:
- ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΡ Π΄Ρ€Π΅ΠΉΡ„Π° Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· доступа ΠΊ старым Π΄Π°Π½Π½Ρ‹ΠΌ.
- АвтоматичСского пСрСзапуска пСрСобучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠΈ сущСствСнного Π΄Ρ€Π΅ΠΉΡ„Π°.

3. ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ:
- Π’Ρ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° событий Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти.
- Latency прСдсказания ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” Π½Π΅ Π±ΠΎΠ»Π΅Π΅ 100 миллисСкунд.

---

β–ͺ️ ## Подсказки:

- ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΏΡ€ΠΎ использованиС on-line learning ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier с partial_fit Π² sklearn, ΠΈΠ»ΠΈ свои Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π° Π±Π΅Π· хранСния ΠΏΠΎΠ»Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ:
- Бтатистики ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ (ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΎΠΊΠ½Π°, гистограммы, PSI / KL-Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ).
- ΠœΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ распрСдСлСний Ρ‡Π΅Ρ€Π΅Π· ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ.
- Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΏΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΎΠ± очСрСдях сообщСний ΠΈ микросСрвисной Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅.
- Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, стоит Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ feature hashing для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

---

β–ͺ️ ## Π§Ρ‚ΠΎ оцСниваСтся:

- Π£ΠΌΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ΄ ограничСния Π·Π°Π΄Π°Ρ‡ΠΈ.
- Навыки построСния систСм с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎ памяти ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΎΡ‚Π²Π΅Ρ‚Π°.
- Π‘ΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Ρ€Π΅ΠΉΡ„ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π½Π° Π½Π΅Π³ΠΎ Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.
- Чистота ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.
- ПониманиС особСнностСй ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ½-ML систСм.

---

β–ͺ️ ## Π Π°Π·Π±ΠΎΡ€ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:

**АрхитСктура Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:**

- Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ½Π»Π°ΠΉΠ½-модСль (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier, Vowpal Wabbit, ΠΈΠ»ΠΈ свою Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ логистичСской рСгрСссии).
- Для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ feature hashing (Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ роста количСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²).
- ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Ρ‚ΡŒ "ΠΆΠΈΠ²ΠΎΠΉ" Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π±ΡƒΡ„Π΅Ρ€ Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти:
- Π₯Ρ€Π°Π½ΠΈΡ‚ΡŒ послСдниС N событий (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½) с рСгулярным ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠ΅ΠΌ ΡƒΡΡ‚Π°Ρ€Π΅Π²ΡˆΠΈΡ… записСй (TTL).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π°:
- Π‘Π»Π΅Π΄ΠΈΡ‚ΡŒ Π·Π° срСдними значСниями ΠΈΠ»ΠΈ частотами ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.
- ΠŸΡ€ΠΈ Ρ€Π΅Π·ΠΊΠΈΡ… измСнСниях β€” Ρ‚Ρ€ΠΈΠ³Π³Π΅Ρ€ΠΈΡ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с нуля.

ΠŸΡ€ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ слоТности:

- ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° "Ρ…ΠΎΠ»ΠΎΠ΄Π½ΠΎΠ³ΠΎ старта" ΠΏΡ€ΠΈ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π΅Π· большого объСма Π΄Π°Π½Π½Ρ‹Ρ….
- Как ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ пСрСобучСния Π½Π° ΡˆΡƒΠΌ ΠΏΡ€ΠΈ частом ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
- Баланс ΠΌΠ΅ΠΆΠ΄Ρƒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ качСством ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΡ‡Π΅Π½ΡŒ частом ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ:

- Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ гистограммы для ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (`histogram_sketching`).
- Feature hashing (`HashingVectorizer`, `FeatureHasher`).
- ΠœΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния (`partial_fit`, warm_start ΠΌΠΎΠ΄Π΅Π»ΠΈ).
- ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ для ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π° Π΄Ρ€Π΅ΠΉΡ„Π°: Population Stability Index (PSI), JS/ KL дивСргСнция.

Π”Π΅Π»ΠΈΡ‚Π΅ΡΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π² коммСнтариях πŸ‘‡

@machinelearning_interview

#собСсСдованиС #Π·Π°Π΄Π°Ρ‡Π° #ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠ΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

BY Machine learning Interview


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/machinelearning_interview/1772

View MORE
Open in Telegram


Machine learning Interview Telegram | DID YOU KNOW?

Date: |

Telegram announces Anonymous Admins

The cloud-based messaging platform is also adding Anonymous Group Admins feature. As per Telegram, this feature is being introduced for safer protests. As per the Telegram blog post, users can β€œToggle Remain Anonymous in Admin rights to enable Batman mode. The anonymized admin will be hidden in the list of group members, and their messages in the chat will be signed with the group name, similar to channel posts.”

How Does Telegram Make Money?

Telegram is a free app and runs on donations. According to a blog on the telegram: We believe in fast and secure messaging that is also 100% free. Pavel Durov, who shares our vision, supplied Telegram with a generous donation, so we have quite enough money for the time being. If Telegram runs out, we will introduce non-essential paid options to support the infrastructure and finance developer salaries. But making profits will never be an end-goal for Telegram.

Machine learning Interview from us


Telegram Machine learning Interview
FROM USA